对关联聚类的扩展及其应用的研究

对关联聚类的扩展及其应用的研究

作者:师大云端图书馆 时间:2022-09-09 分类:参考文献 喜欢:2220
师大云端图书馆

【摘要】数据时代下智能化是各种设备和应用发展的一大趋势,各种数据挖掘技术正被用于实现这一目标。虽然数据时代的前景十分美好,但是也充满着各种挑战。首先,数据搜集和存储的代价越来越小,而人们处理数据的速度却远不及数据增长的速度。其次,获取的数据存在包括噪声、无结构性、信息缺省等多方面的质量问题,这为数据分析带来了不少困难。现实中获取的数据大部分为无监督类型的,快速高效的无监督学习方法不仅能够适当缓解数据处理压力,而且能够根据其所发现的价值帮助后续的数据收集工作。聚类分析是无监督学习的重要内容,有着久远的发展历史。相比起其他聚类方法,关联聚类能够不需预定义而自动选择合适的簇类数目进行聚类,这种特性使其更加适用于真实数据场景。然而关联聚类因其求解十分困难,多年来一直未能得到广泛应用。鉴于此,本文针对关联聚类问题进行了如下研究:(1)分别对关联聚类、最小k-割问题和二次半分配问题的数学优化形式进行了重构,一方面阐述了三者之间的相互关系和求解难度,另一方面以此说明利用现有的解决类似问题的松弛技术很难有所突破,应寻求其他方法。(2)通过对关联聚类求解难点的分析,引入聚类指示矩阵和聚类分配这两个新的变量,对原问题进行重新形式化,松弛掉问题的非关键约束,提出了一种单次迭代时间复杂度为O(|V|+|E|)的基于伪期望最大的迭代算法—-Pseudo-EM。此外,本文讨论了一种启发式的聚类指示矩阵的初始化方法和数据的稀疏性问题,并利用实验验证了算法的有效性。(3)本文最后探索了关联聚类的扩展应用,文中列举了两个关于聚类分析的典型应用——图像分割和社区挖掘。在图像分割中,基于Pseudo-EM的算法表现出了比谱聚类更加自然的分割结果。在社区挖掘中,算法能够十分接近地恢复真实的社区数目,并且所挖掘的社区质量也比其他算法更优。
【作者】汪于波;
【导师】徐林莉;
【作者基本信息】中国科学技术大学,计算机应用技术,2014,硕士
【关键词】聚类分析;关联聚类;伪期望最大化算法;聚类应用;图像分割;社区挖掘;

【参考文献】
[1]毛垣生.自建数据库中文本挖掘及检索技术[J].情报杂志,2004,04:29-30+32.
[2]周少光.韶峰集团市场营销战略的调整与实施[D].湖南大学,工商管理,2003,硕士.
[3]曾昭华,多超美.江西省鄱阳湖地区地下水资源的开发利用分区[J].江西地质科技.1997(04)
[4]何艳艳.元素扩散影响高铝青铜喷焊层摩擦磨损性能的研究[D].兰州理工大学,材料加工工程,2014,硕士.
[5]杨广.控制流提取模型及软件可靠性评价应用研究[D].大连理工大学,计算机应用技术,2013,硕士.
[6]朱永飞.中国武术技术传承的理论研究[D].苏州大学,民族传统体育学,2012,硕士.
[7]姚晓蕾.酒店管理系统的设计与实现[D].吉林大学,软件工程,2012,硕士.
[8]史威.城市社区养老服务工作者队伍建设研究[D].湖南师范大学,社会保障,2013,硕士.
[9]侯录新,李永智,王海瑛.ZQJ-01型转辙机表示缺口光电监测报警系统[J].铁道通信信号.2005(05)
[10]陈静.石墨烯修饰电极对微生物燃料电池产电性能的影响研究[D].长安大学,市政工程,2013,硕士.
[11]徐洁.西部欠发达地区民族高等院校教师激励问题研究[D].兰州大学,公共管理(专业学位),2013,硕士.
[12]盛凯旋.石墨烯组装体的制备及其电化学应用研究[D].清华大学,2013.
[13]郁强.调肝理脾方治疗非酒精性脂肪性肝病(肝郁脾虚证)的临床研究[D].首都医科大学,中医内科学,2014,硕士.
[14]蔡志雄.电网工程大件运输措施费用构成及运输路线的优化设计[D].浙江大学,项目管理(专业学位),2012,硕士.
[15]王欣庆.重庆移动市场经营自助分析系统的设计与实现[D].重庆大学,软件工程(专业学位),2014,硕士.
[16]丁磊.吉林省业余体校后备人才实行“竞教结合”培养模式现状及对策分析[D].辽宁师范大学,体育教育训练学,2011,硕士.
[17]林卉.CF4G18汽油发动机控制策略研究及标定单元设计[D].湖南大学,控制理论与控制工程,2011,硕士.
[18]李宇晴.“慎独”视角下的中学生网络道德教育研究[D].成都理工大学,思想政治教育,2013,硕士.
[19]牟静丰.电子票据法律问题研究[D].吉林大学,法律,2013,硕士.
[20]赵涛.煤巷复合顶板锚杆支护技术研究[D].西安科技大学,岩土工程,2014,硕士.
[21]吴磊.仿紧局部紧空间的L-映象[D].广西大学,基础数学,2004,硕士.
[22]陈臣.陕西紫阳县和平瓦板岩矿床地质特征及其控矿条件分析[D].长安大学,构造地质学,2013,硕士.
[23]张天明.农村中小学教育信息化建设与效果研究[D].华中师范大学,现代教育技术,2013,硕士.
[24]马小燕.A公司存货内部控制研究[D].湖南大学,MPAcc,2013,硕士.
[25]潘渝,王光锷,陈乐寿,严又生.二维地电构造大地电磁测深资料的解析方法[J].石油地球物理勘探,1987,03:315-328+272.
[26]杨震.硬脊膜动静脉瘘Onyx胶血管内栓塞治疗效果评估[D].第四军医大学,外科学(专业学位),2014,硕士.
[27]梁芳.基于Zigbee的监区人员定位研究[D].中北大学,信号与信息处理,2014,硕士.
[28]秦雨航.基于ArcEngine组件技术的道路交通流量信息管理系统设计与实现[D].重庆交通大学,大地测量学与测量工程,2012,硕士.
[29]邓乐来,彭名书.非线性耦合下延时复杂网络系统的牵制控制[J].电子技术与软件工程,2015,12:11.
[30]师瑾.不同剂量μ受体拮抗剂CTOP对瑞芬太尼诱发痛觉过敏的影响[D].山西医科大学,麻醉学,2013,硕士.
[31]崔佃忠.铝/钢异种金属CMT熔—钎焊工艺及接头特性研究[D].江苏科技大学,材料加工工程,2013,硕士.
[32]刘永平.探析贸易摩擦常态化的治理策略[J].国际贸易,2014,11:30-34.
[33]马宁宁.保肝复功丸治疗慢性乙型病毒性肝炎的临床研究[D].湖北中医药大学,中医内科学(专业学位),2013,硕士.
[34]张啸天.基于洛阳A公司员工满意度的管理研究[D].河南科技大学,企业管理,2014,硕士.
[35]张庆国.氧含量影响钢液吸氮的理论研究[J].炼钢.2003(06)
[36]张俊龙.ITER极向场PF1内馈线支撑的设计与分析[D].合肥工业大学,机械电子工程,2013,硕士.
[37]齐春华.地源热泵水平埋管地下传热性能与实验研究[D].天津大学,热能工程,2004,硕士.
[38]隋洋.21世纪不动产公司在昆明的发展战略研究[D].云南大学,工商管理,2012,硕士.
[39]丁彬楚,汤洪涛.面向作业车间重调度的改进合同网机制研究[J].机电工程,2013,02:147-151.
[40]杨敏,邱菀华,娄晓琪.允许主体通过抽样获取信息的MG模型性质的研究[J].控制与决策,2004,04:420-423+428.
[41]任玉辉.WEB下的试卷库系统与网络在线考试系统的实现[D].吉林大学,软件工程,2014,硕士.
[42]夏雅淋,邓春艳,向娟.基于BCNTs/GC电极的鸟嘌呤与腺嘌呤电化学行为及其同时检测[J].电化学,2012,04:365-370.
[43]张雷.旋转活塞式发动机配气机构设计及特性研究[D].国防科学技术大学,机械工程,2012,硕士.
[44]王旭博.车联网环境下数据融合信任模型研究[D].长安大学,交通运输工程(专业学位),2014,硕士.
[45]崔名铠.中国货币与信贷统计改革研究[D].西南财经大学,统计学,2013,博士.
[46]冯卓津.空气滤清对发动机寿命的影响[J].城市公共交通.2002(01)
[47]刘鑫.基于粒子滤波的多个弱目标检测前跟踪算法研究[D].杭州电子科技大学,控制理论与控制工程,2014,硕士.
[48]陈锐强.核电站管道流固耦合应力分析[D].大连理工大学,计算力学,2013,硕士.
[49]崔垚.航天器低冲击分离控制技术研究[D].哈尔滨工业大学,航天工程,2013,硕士.
[50]刘冰清.韩国公民道德教育研究[D].广西民族大学,伦理学,2013,硕士.

相关推荐
更多